Sử dụng thống kê sai Thống_kê

Sử dụng sai mục đích các số liệu thống kê có thể có những kết quả không lường được, những sai số nghiêm trọng trong mô tả và giải thích sai ý nghĩa ngay cả các chuyên gia có kinh nghiệm cũng có các lỗi như vậy, và nghiêm trọng là chúng có thể dẫn đến đưa ra quyết định sai. Ví dụ chính sách xã hội, nghề thuốc, và độ tin cậy của cấu trúc dựa trên các số liệu thống kê.

Ngay cả khi các kỹ thuật thống kê được áp dụng một cách chính xác, kết quả có thể khó để giải thích cho những người thiếu chuyên môn. Ý nghĩa thống kê của một phương pháp có thể được gây ra bởi sự thay đổi ngẫu nhiên trong mẫu, có thể hoặc không thể đồng ý với đánh giá trực quan của mức ý nghĩa. Tập hợp các kỹ năng thống kê cơ bản mà mọi người cần phải thỏa thuận với các thông tin trong cuộc sống hàng ngày như một kỹ năng trong lĩnh vực thống kê.

Có ý kiến cho rằng kiến thức thống kê được cho là bị lạm dụng một cách quá bình thường bằng cách tìm ra hướng để giải thích các dữ liệu có ích cho người trình bày[18]. Một sự nghi ngờ và tìm hiểu sai về số liệu thống kê được kết hợp với các trích dẫn, “có ba loại của sự lừa dối: dối trá, rất dối trá và thống kê”. Lạm dụng các số liệu thống kê có thể có được kể cả vô ý và có chủ ý, và cuốn sách làm thế nào để nói dối các nhà thống kê[18] đã chỉ ra một loạt các quyết định. Trong một nỗ lực để làm sáng tỏ việc sử dụng và lạm dụng các số liệu thống kê, đánh giá các kỹ thuật thống kê được sử dụng trong các lĩnh vực cụ thể được thực hiện (ví dụ: Warne, Lazo, Ramos, and Ritter).[19]

Cách để tránh số liệu thống kê bao gồm sử dụng sơ đồ thích hợp và ngăn ngừa sai số.[20] Sử dụng sai số có thể xảy ra khi kết luận là sai số quá lớn và yêu cầu có tính đại diện hơn so với giá trị thật, thường là cố ý hay vô ý không nhận thấy ra sai số mẫu.[21] Đồ thị dạng cột được cho là biểu đồ đơn giản nhất để sử dụng và hiểu, các biểu đồ này có thể vẽ bằng tay hoặc bằng các chương trình máy tính đơn giản[20]. Nhưng hầu hết mọi người đều không nhìn ra giá trị sai lệch hay sai số, vì vậy những lỗi sai này không được sửa chữa. Nên mọi người thường tin vào kết quả ngay cả khi nó không phải là kết quả tốt.[21] Để làm cho dữ liệu thu thập được từ các số liệu thống kê đáng tin cậy và chính xác, mẫu được chọn phải có tính tổng thể.[22] Theo Huff, “độ tin cậy của một mẫu có thể bị phá hủy giá trị sai lệch, cho phép một số mức độ hoài nghi”[23]

Để hỗ trợ cho sự hiểu biết của các số liệu thống kê, Huff đã đề xuất một loạt các câu hỏi được hỏi trong mỗi trường hợp:[23]

  • Ai nói vậy?
  • Làm thế nào để anh/chị biết
  • Những gì còn thiếu
  • Có ai thay đổi nội dung
  • Nó có ý nghĩa không

Hiểu sai mối tương quan

The confounding variable problem: X and Y may be correlated, not because there is causal relationship between them, but because both depend on a third variable Z. Z is called a confounding factor.

Các khái niệm về mối tương quan đặc biệt đáng chú ý cho những rắc rối tiềm ẩn có thể xảy ra. Phân tích thống kê của một tập dữ liệu thường cho thấy rằng hai biến (thuộc tính) của tổng thể được xem xét dưới nhiều trường hợp khác nhau, như chúng có mối quan hệ. Ví vụ, một nghiên cứu về thu nhập hàng năm mà dựa vào độ tuổi có thể cho thấy rằng người nghèo có xu hướng có cuộc sống ngắn hơn so với người giàu. Hai biến được cho là có quan hệ, tuy nhiên, nó có thể có hoặc không với biến khác. Các hiện tượng tương quan có thể được giải thích bởi một hiện tượng trước đây không được xem xét đến như một yếu tố thứ ba, gọi là biến nhiễu hoặc biến bác bỏ. Vì lý do này, không còn cách nào để lập tức suy ra sự tồn tại của một quan hệ nhân quả giữa hai biến. (xem tương quan nào không đưa đến kết quả).